分层聚类算法

分层聚类算法

 

看到很多地方都讲到分层聚类法,这到底是什么东东,今天来研究一下。

分层聚类法是聚类算法的一种,聚类算法是数据挖掘的核心技术,把数据库中的对象分类是数据挖掘的基本操作,其准则是使属于同一类的个体间距离尽可能小,而不同类个体间距离尽可能大。

聚类算法一般分为分割分层两种。

分割聚类算法通过优化评价函数把数据集分割为K个部分,它需要K作为输人参数。

典型的分割聚类算法有K-means算法, K-medoids算法、CLARANS算法。

分层聚类由不同层次的分割聚类组成,层次之间的分割具有嵌套的关系。它不需要输入参数,这是它优于分割聚类算法的一个明显的优点,其缺点是终止条件必须具体指定。

典型的分层聚类算法有BIRCH算法、DBSCAN算法和CURE算法等。

各聚类算法的比较结果

算法        算法效率   适合的数据类型   发现的聚类类型   对脏数据或异常数据的敏感性   对数据输入顺序的敏感性
BIRCH         高            数值              凸形或球形                  不敏感                          不太敏感
DBSCAN     一般          数值                任意形状                    敏感                               敏感
CURE         较高          数值                任意形状                   不敏感                          不太敏感
K-poto      一般         数值和符号         凸形或球形                  敏感                                一般
CLARANS   较低           数值               凸形或球形                  不敏感                          非常敏感
CUQUE      较低           数值               凸形或球形                  一般                               不敏感

参考文献

【1】张红云、刘向东、段晓东、苗夺谦、马垣,数据挖掘中聚类算法比较研究,《计算机应用与软件》2003 Vol.20 No.2 : 5~6

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值